Meta-reinforcement learning via orbitofrontal cortex | Nature (2023)
Ryoma Hattori, Nathan G. Hedrick, Anant Jain, Shuqi Chen, Hanjia You, Mariko Hattori, Jun-Hyeok Choi, Byung Kook Lim, Ryohei Yasuda & Takaki Komiyama hl.icon
我々は何か新しいものを学習するときでも、昔の経験を活かしてうまく学習することができる
Naa_tsure.iconプログラミングに慣れていると、新しいプログラミング言語が発表されても素早く学習することができたりする
早い時間スケール:神経活動のリカレントダイナミクス
Naa_tsure.iconシナプスの強度が変化→ネットワークのダイナミクスが変化
しかし、実際の動物の脳内で異なる時間スケールの学習がおこなわれているかは不明